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摘 要 


基于 ABR 模型 考察 奖赏 预期 和 奖赏 结果 对 不 同 难度 词 对 记忆 与 元 记忆 的 影响 。 结 果 发 现 : (1) 限 时 学 习 


条 件 下 ,奖赏 结果 促进 不 同 难度 词 对 记忆 成 绩 和 学 习 判 断 , 奖赏 预期 仅 提高 简单 词 对 的 记忆 成 绩 。(2) 自 定 步调 学 
习 条 件 下 ,定时 学 习 判 断 时 奖赏 结果 仅 影 响 学 习 判 断 ; 奖赏 预期 促进 高 难度 词 对 的 学 习 时 间 分 配 ， 从 而 提高 记忆 


成 绩 和 学 习 判 断 。(3) 在 自 定 步调 学 习 时 ,奖赏 预期 超越 难度 成 为 影响 学 习 时 间 分 配 的 因素 。 以 上 结果 表明 , 个 体 
会 综合 奖赏 预期 、 奖 赏 结果 和 难度 构建 学 习 议 程 , 足够 大 的 奖赏 预期 会 超越 难度 成 为 议程 构建 的 主导 因素 。 但 奖 


赏 预期 和 奖赏 结果 对 记忆 成 绩 、 
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1 引言 


元 记忆 是 对 记忆 过 程 进行 监测 和 控制 的 元 认 
知 成 分 (Flavell, 1979; Flavell & Wellman, 1977), 包 
括 元 记忆 监测 和 控制 (Nelson，1990)。 元 记忆 监测 
(metamemory monitoring) 是 个 体 根据 记忆 材料 特 
征 、 学 习 条 件 与 目标 、 自 身 记 忆 特 点 等 对 记忆 过 程 
和 状态 的 主观 评价 或 判断 ， 元 记忆 监测 会 影响 自我 
调节 学 习 中 认 知 资源 的 分 配 。 学 习 判 断 Gudgements 
of learning，JOLs) 是 一 种 前 脆性 元 记忆 监测 指标 ， 
是 个 体 在 学 习 之 后 对 于 已 学 习 项 目 在 未 来 测试 中 
成 功 回 忆 可 能 性 的 预测 (Dunlosky & Nelson, 1992)。 
元 记忆 控制 (metamemory controD 是 在 元 记忆 监测 
基础 上 进行 的 对 记忆 过 程 的 调节 和 控制 (Nelson， 
1990)， 自 定 步 调 学 习 时 的 学 习 时 间 分 配 (study time 
allocation) 是 元 记忆 控制 的 核心 成 分 。 


学 习 时 间 分 配 和 学 习 判 断 的 影响 受 学 习 条 件 调节 。 
奖赏 预期 , FIFI, 学习 时 间 分 配 , 元 记忆 ,记忆 


配 的 影响 存在 不 一 致 的 结果 : 当 实 验 指导 语 为 记 住 
一 个 项 目 得 1 分 , 要 求 尽量 得 更 多 分 时 ,被 试 会 优 
和 完 学 习 容 易 项 目 并 给 其 更 高 JOLs (Koriat & 
Nussinson, 2009)。 但 当 困 难 项 目 价 值 更 高 时 , 个 体 
就 会 优先 学 习 困 难 项 目 并 分 配 更 多 学 习 时 间 , JOLs 
也 以 价值 为 导向 (Koriat & A ckerman, 2010; Price 
et al.，2010)。 为 解决 上 述 争 议 ，Ariel 等 人 (2009) 引 
入 奖赏 结构 (reward structure), 包括 项 目 价 值 和 项 
目测 试 可 能 性 ， 考 察 其 对 不 同 难度 项 目 学 习 时 间 分 
配 的 影响 。 发 现 不 论 加 工 容易 还 是 困难 项 目 , 个 体 
会 依据 项 目测 试 可 能 性 进行 项 目 选 择 ,优先 学 习 测 
试 可 能 性 较 高 (90%) 的 项 目 ; 将 测试 可 能 性 换 成 项 
目 价 值 , 结果 相同 ， 即 个 体 依据 项 目 价值 做 项 目 选 择 。 

上 述 研 究 表 明 ， 当 项 目 同时 具有 难度 和 奖赏 结 
构 上 的 不 同 特征 时 , 学习 者 并 非 先 考虑 项 目 难度 ， 
而 是 优先 依据 项 目的 奖赏 结构 进行 JOLs 和 项 目 选 


有 人 研究 表明 , JOLs 和 学 习 时 间 分 配 受 项 目 难 度 
影响 (Koriat & Ackerman, 2010; Price et al., 2010). 
但 另 有 研究 却 发 现 项 目 难 度 对 JOLs 和 学 习 时 间 分 
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择 ， 即 奖赏 结构 对 JOLs 和 学 习 时 间 分 配 的 影响 超 
过 了 项 目 难 度 。 据 此 ， 有 研究 提出 了 基于 议程 的 调 
节 模 型 (Agenda-Based Regulation Model, ABR) 来 解 
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释 学 习 者 综合 考虑 项 目 难 度 和 价值 后 建立 的 议程 
对 学 习 时 间 分 配 的 影响 (Ariel et al., 2009; Yu et al., 
2020). 该 模型 认为 , 个 体会 综合 任务 要 求 等 学 习 条 
件 , 构建 学 习 议 程 ， 并 在 此 基础 上 不 断 调 整 自 己 的 
学 习 行 为 。 在 这 一 过 程 中 ,足够 高 的 项 目 价值 能 够 
取代 难度 对 JOLs 和 学 习 时 间 分 配 产生 主导 性 影 啊 。 

但 是 , ABR 模型 仅 将 项 目 价值 和 测试 可 能 性 作 
为 奖赏 结构 ,未 对 奖赏 加 工 的 不 同时 段 进行 区 分 。 
依据 发 生 在 奖赏 期 竺 和 奖赏 获得 两 个 不 同时 段 ， 奖 
赏 加 工分 为 欲求 阶段 (appetitive phase) 和 执行 阶段 
(consummatory phase)， 对 应 于 这 两 个 时 段 的 奖赏 
结构 分 别 是 奖赏 预期 (reward expectation) 和 奖赏 结 
果 (reward outcome) 两 种 成 分 (Mason et al., 2017). 
奖赏 预期 是 被 试 对 成 功 记忆 项 目 能 获得 收益 的 猜 
测 ， 奖赏 结果 是 被 试 成 功 记忆 该 项 目 后 获得 的 分 值 
或 奖赏 。 先 前 研究 对 项 目 价 值 或 测试 可 能 性 的 呈现 
均 在 项 目 呈 现 前 , 被 试 在 项 目 编 码 前 已 知 成 功 记 住 
该 项 目 能 获得 的 奖赏 ,无需 猜测 可 能 获得 的 收益 ， 
不 产生 奖赏 预期 。 因 此 , ABR 模型 只 考虑 了 奖赏 结 
果 对 学 习 时 间 分 配 的 影响， 而 忽略 了 奖赏 预期 的 作 
用 。 如 果 在 项 目 呈 现 前 仅 用 指导 语 告知 成 功 记 住 该 
项 目 会 获得 奖励 ， 具体 分 值 在 编码 后 呈现 , 被 试 就 
会 对 项 目 产生 奖赏 预期 ,能够 考察 奖赏 预期 对 
JOLs 和 学 习 时 间 分 配 的 影响 。 

Soderstrom I] McCabe (2011) 引 入 价值 呈现 顺 
序 这 一 变量 , 控制 价值 在 项 目前 或 后 呈现 ,考察 因 
价值 呈现 顺序 带 来 的 奖赏 预期 、 奖 赏 结 果 和 词 对 相 
关 程 度 ( 即 难度 ) 对 JOLs 的 影响 。 结 果 发 现 , 在 固定 
步调 学 习 中 , JOLs 仅 受 奖赏 结果 的 影响 ， 而 与 价值 
呈现 顺序 无 关 ; 而 在 自 定 步 调 学 习 中 , 价值 呈现 顺 
序 虽 仍 不 影响 JOLs, 但 呈现 顺序 和 奖赏 结果 对 学 
习 时 间 分 配 的 影响 存在 交互 作用 仅 当 价值 呈 
现在 编码 前 时 ， 奖赏 结果 才能 够 影响 学 习 时 间 分 配 
和 回忆 成 绩 ， 而 当 价 值 在 编码 后 呈现 时 ,奖赏 结 
的 效应 消失 。 但 这 一 结果 可 能 是 因 其 变量 和 条 件 设 
置 局 限 导 致 : 实验 中 的 每 个 项 目 都 匹配 了 价值 ， 导 
致 不 论 价 值 呈现 在 编码 前 、 后 , 被 试 都 会 对 分 值 结 
果 产 生 预 期 , 存在 奖赏 结果 和 奖赏 预期 的 混淆 , H. 
考察 奖赏 预期 作用 时 缺少 无 预期 作为 基线 比较 。 
此 该 研究 实际 上 无 法 对 奖赏 预期 是 否 影响 JOLs 和 
学 习 时 间 分 配 ， 以 及 奖赏 预期 高 低 怎样 影响 JOLs 
和 学 习 时 间 分 配 等 问题 做 出 解释 。 

综 上 ,已 有 研究 缺乏 对 奖赏 预期 影响 JOLs 和 
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预期 成 分 进行 验证 。 因 此 , 本 研究 将 奖赏 预期 成 分 
补充 进 ABR 模型 中 ,验证 在 基于 难度 与 价值 的 学 
习 议 程 构建 中 , 足够 高 的 奖赏 预期 是 否 能 够 取代 难 
度 对 JOLs 和 学 习 时 间 分 配 产生 主导 性 影响 。 共 3 
个 实验 : 实验 1 在 Soderstrom 和 McCabe (2011) 的 
实验 基础 上 加 入 控制 组 ， 旨 在 通过 将 奖赏 后 置 呈 现 
考察 奖赏 预期 对 限时 学 习 时 JOLs 和 回忆 正确 率 的 
影响 ; 实验 2 取消 学 习 时 限 被 试 自主 控制 学 习 时 间 ， 
旨 在 考察 后 置 条 件 下 奖赏 对 学 习 时 间 分 配 的 影响 。 
实验 3 在 实验 2 的 基础 上 , 通过 操纵 价值 梯度 来 控 
制 奖赏 预期 旨 在 考察 后 置 条 件 下 奖赏 预期 梯度 大 
小 对 自 定 步调 学 习 的 影响 。 


2 实验 1: 编码 后 奖 沉 与 项 目 难 度 
对 限时 学 习 的 影响 


实验 1 通过 2 (难度 : 简单 、 困 难 ) x 2 (奖赏 预 
期 : A. 无 ) 和 2 (难度 : 简单 、 困 难 ) x 2 (奖赏 结果 : 
高 、 低 ) 实 验 设计 , 将 价值 后 置 探究 奖赏 预期 、 奖 赏 
结果 和 难度 对 被 试 JOLs 和 回忆 正确 率 的 影响 。 奖 
赏 组 以 价值 高 低 作为 控制 奖赏 结果 的 方法 。 而 非 奖 
赏 组 不 设 任 何 分 值 作为 基线 。 由 于 价值 呈现 在 项 目 
后 ,价值 不 能 作为 记忆 的 有 效 线 索 ， 因 此 假设 奖赏 
结果 对 被 试 回忆 正确 率 无 显著 影响 ,而 对 JOLs 影 
响 显 著 。 

2.1 实验 方法 
2.1.1 in 

依据 前 人 研究 中 的 平均 效应 量 d = 0.6 来 确定 
被 试 量 (Peng & Tullis, 2021). (1 一 B) = 0.95, 使 用 
G* Power 3 进行 效能 分 析 , 发 现 a = 0.05 时 推荐 的 
最 小 被 试 量 为 8 人 。 实 验 2 被 试 量 的 计算 同上 。 

东北 师范 大 学 60 名 在 校 大 学 生 参 与 了 本 次 实 
验 , 根据 被 试 报 名 顺序 随机 分 配 为 奖赏 组 (29 人 ) 和 
非 奖 赏 组 (31 人 ), 记忆 材料 平均 通过 率 为 0.3~0.55 
(Yu et al., 2020), 5 名 被 试 的 数据 因 记 忆 正 确 率 低 于 
10% 而 剔除 .有效 被 试 55 名 ( 男 24 人 , 女 31 A, Æ 
均 年 龄 20.35 岁 , SD = 2.34)。 被 试 视力 正常 或 矫正 
视力 正常 , 无 脑 损 伤 或 精神 病史 ,之 前 未 参加 过 类 
似 实验 。 所 有 被 试 自 愿 参加 本 实验 , 在 实验 开始 前 
签署 知情 同意 书 ， 实 验 结束 后 获得 相应 报酬 。 
2.1.2 ”实验 材料 

以 线索 回忆 通过 率 为 指标 确定 词 对 难度 ,选取 
高 (通过 率 : 0.03~0.13)、 低 (通过 率 : 0.63~0.87) 难 度 
词 对 各 30 对 用 于 正式 实验 , 另外 选取 7 个 中 等 难度 


学 习 时 间 分 配 的 有 效 考察 , ABR 模型 尚 需 通过 奖赏 


词 对 用 于 练习 ,共计 67 个 中 性 词 对 构成 本 实验 材 
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料 (Yu et al., 2020)， 例 如 “电报 (线索 词 ) 一 茶叶 (目标 
词 )”。 词 频 控 制 在 0.00076~0.00997, 笔画 数 范围 在 
7~30 画 ， 音 节 数 范围 在 4~6 个 。 

为 避免 首 因 和 近 因 效应 , 正式 实验 中 最 初 2 个 
和 最 后 2 个 词 对 作为 填充 刺激 不 计 入 数据 分 析 
(Soderstrom & McCabe, 2011)， 有 效 词 对 共计 56 4, 
简单 和 困难 词 对 各 半 。 在 奖赏 组 ,每 个 词 对 都 匹配 
了 0~6 中 一 个 分 值 。 因 此 , 各 价值 条 件 下 分 别 有 8 
个 trial。 
2.1.3 ”实验 仪器 

实验 程序 使 用 E-Prime 2.0 软件 编写 。 实 验 设 
备 采 用 配 有 21 英 时 CRT 彩色 纯 平 显示 器 的 联想 多 
媒体 计算 机 ,分辨 率 为 1024x768，, 刷新 率 为 75 Hz. 
使 用 SPSS 26.0 软件 进行 数据 处 理 与 分 析 。 
2.1.4 ”实验 程序 

实验 分 为 学 习 阶段 和 测试 阶段 。 学 习 阶 段 具 体 
流程 见 图 1。 首先 , 屏幕 上 呈现 一 个 注视 点 0.5 s， 提 
醒 被 试 集中 注意 ; 之 后 , 屏幕 上 呈现 一 组 双 字 词 对 ， 
被 试 需要 在 4s 内 对 其 进行 记忆 ; 然后 ,奖赏 组 被 试 
的 屏幕 上 会 呈现 0~6 不 等 的 分 值 1 s， 如 果 测 试 阶 
段 能 够 成 功 回 忆 该 词 对 ,会 获得 与 其 分 值 匹配 的 额 
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外 被 试 费 ,控制 组 被 试 屏幕 上 呈现 一 个 等 时 的 空 屏 ; 
最 后 , 被 试 需要 对 之 后 能 否 正 确 回忆 做 0~100 的 信 
心 判 断 ， 并 用 数字 键盘 输入 。 共计 60 个 词 对 , 学习 
30 个 词 对 后 休息 ， 待 被 试 状 态 恢 复 后 完成 剩余 30 
个 词 对 的 学 习 。 学 习 阶 段 结束 后 进行 “ 自 2000 开始 
的 连续 减 3” 干 扰 任 务 3 分 钟 ， 之 后 进入 测试 阶段 : 
所 有 线索 词 呈 现在 Excel KP, 不 限时 回忆 与 之 对 应 
的 目标 词 并 输入 。 无 法 回忆 的 项 目 跳 过 并 继续 作答 。 
2.2 ”结果 

实验 1 中 各 价值 项 目 及 控制 组 的 回忆 正确 率 和 
JOLs 值 见 表 1。 
2.2.1 无 奖赏 和 0 价值 对 回忆 正确 率 影响 

基于 无 奖赏 和 0 价值 两 个 条 件 ， 考 察 奖 赏 预期 
和 难度 对 限时 学 习 回 忆 正 确 率 的 影响 ,进行 混合 测 
量 方差 分 析 。 结 果 发 现 : 组 别 主 效应 不 显著 ，F(1， 
53) = 0.25, p = 0.62， 无 奖赏 QU = 35.12) 与 0 价值 词 
对 (M = 37.60) 的 回忆 正确 率 无 显著 差异 。 难 度 主 效 
应 显著 , FC, 53) = 113.747, p < 0.001, mi= 0.68, f 
单词 对 回忆 正确 率 (M = 54.15) 显 著 高 于 困难 词 对 
(M =18.25); 交互 作用 不 显著 , F(1, 53) = 1.03, p = 
0316. 


有 多 大 把 握 能 够 
正确 回忆 ? (0-100) 


图 1 实验 1 奖赏 组 学 习 阶 段 流程 网 
R1 有 奖赏 组 与 无 奖赏 组 的 回忆 正确 率 和 学 习 判 断 的 平均 数 和 标准 差 (M + SD) 
难度 无 奖赏 组 有 奖赏 组 (n = 24) 
(n = 31) 0 1 3 4 5 6 

回忆 正确 率 

困难 18.67 + 17.06 17.00+ 24.49 24.00+18.26 22.00+26.99 11.00+15.95 23.40+24.51 28.00+ 26.02 22.00 + 29.34 

容易 51.56+18.40 57.00+ 29.03 62.00+35.11 49.60+22.28 64.20+29.56 62.00+35.43 69.00+27.14 65.00 + 29.32 
JOLs 

困难 47.33 20.74 30.26 + 19.40 44.81 +20.76 39.604 20.59 46.43 +17.77 46.56+ 19.83 55.72+ 20.98 49.91 + 24.03 

容易 58.08 + 19.35 44.36 士 24.90 49.46418.37 46.16 +22.11 56.33 +18.47 54.74+416.81 52.26+19.29 59.68 + 20.03 
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2.2.2 无 奖赏 和 0 价值 对 JOLs 影响 
基于 无 奖赏 和 0 价值 两 个 条 件 ， 考察 奖赏 预期 
和 难度 对 限时 学 习 JOLs 的 影响 ,对 数据 进行 混合 
测量 方差 分 析 。 结 果 发 现 : 组 别 主 效应 显著 ,Fl(1， 
53) = 7.58, p = 0.008, f= 0.13, 无 奖赏 JOLs (M = 
52.28) 与 0 价值 词 对 (CM = 36.65) 的 JOLs 差异 显著 ; 
表明 奖赏 结果 后 置 时 , 被 试 对 0 价值 词 对 的 JOLs 
有 较 低 的 判断 ,在 价值 后 置 时 被 试 注意 到 了 0 这 一 
价值 ， 并 减少 了 对 这 一 价值 所 对 应 词 对 的 信心 。 难 
度 主 效应 显著 , FC, 53) = 51.99, p < 0.001, n5 = 0.50, 
简单 词 对 JOLs (M = 51.49) 显 著 高 于 困难 词 对 (M = 
40.00); 交互 作用 不 显著 , F(1, 53) = 0.17, p = 0.68。 
与 有 奖赏 结果 中 的 1~6 价值 相 比 , 0 价值 词 对 
无 法 为 被 试 带 来 任何 收益 , 被 试 认识 到 对 0 价值 词 
对 的 记忆 会 造成 认 知 资源 的 浪费 。 因 此 在 得 到 0 价 
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差异 ,奖赏 预期 对 限时 学 习 的 JOLs 无 显著 影响 。 
难度 主 效应 显著 , FC, 53) = 104.02, p < 0.001, n} = 
0.66， 简 单词 对 JOLs (M = 54.87) 显 著 高 于 困难 词 
对 (M = 44.97), 表明 被 试 在 进行 JOLs 时 ， 以 难度 为 
主要 线索 。 交 互 作用 不 显著 , FU, 53) = 1.49, p = 
0.228， 有 奖赏 预期 和 无 奖赏 预期 时 ,被 试 对 困难 
项 目的 JOLs 都 低 于 简单 项 目的 JOLs (图 2a)。 
2.2.4 ”奖赏 预期 与 难度 对 回忆 正确 率 的 影响 

为 考察 后 置 条 件 下 ， 奖 赏 预 期 和 难度 对 限时 学 
习 回 忆 正 确 率 的 影响， 对 数据 进行 重复 测量 方差 分 
H, 结果 发 现 : 奖赏 预期 主 效应 不 显著 , FA, 53) = 
2.46, p = 0.123, 奖赏 预期 对 被 试 回忆 成 绩 无 显著 
影响 ; 难度 主 效应 显著 , F, 53) = 361.26, p < 0.001, 
no = 0.872, 简单 词 对 回忆 正确 率 (M = 56.45) 显 著 高 
于 困难 词 对 (M = 19.95), 被 试 更 多 记 住 了 简单 词 对 ， 


值 结 果 后 , 在 进行 JOLs 时 就 不 会 再 对 该 词 对 进行 
复述 等 继续 加 工 , 但 无 奖赏 词 对 在 做 JOLs 时 被 试 
会 做 复述 , JOLs 结果 也 验证 了 上 述 推测 ,被 试 对 无 
奖赏 词 比 对 0 价值 词 对 的 JOLs 更 高 。 但 是 ， 这 种 
对 0 价值 词 对 在 JOLs 时 的 不 复述 , 本 该 导致 0 价 
值 词 对 的 记忆 成 绩 低 于 无 奖赏 条 件 的 词 对 ， 可 实际 
上 二 者 并 无 显著 差异 。 这 可 能 是 因为 与 无 奖赏 条 件 
相 比 ,0 价值 词 对 的 编码 受到 了 奖赏 预期 的 额外 促 
DE, 奖赏 预期 的 促进 作用 与 0 价值 奖赏 结果 的 削弱 
作用 相抵 消 , 才 导 臻 了 0 价值 与 无 奖赏 条 件 下 词 对 
的 回忆 正确 率 无 显 车 差异 。 
2.2.3 ”奖赏 预期 与 难度 对 JOLs 的 影响 

为 考察 后 置 条 件 下 ,奖赏 预期 和 难度 对 限时 学 
习 JOLs 的 影响 ,对 数据 进行 重复 测量 方差 分 析 ， 
结果 发 现 : 奖赏 预期 主 效应 不 显著 , FA, 53) = 1.70, 
p = 0.198, 说 明 奖 赏 组 与 非 奖 赏 组 的 JOLs 无 显著 
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奖赏 组 非 奖赏 组 
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图 2 


词 对 难度 对 被 试 记忆 成 绩 产 生 影 响 ; 交互 作用 显著 ， 
F(1, 53) = 4.51, p = 0.038, n= 0.08。 进 一 步 简单 效 
应 分 析 结 果 表 明 , 简单 词 对 时 ,奖赏 组 回忆 正确 率 
(M = 62.78) 和 非 奖 赏 组 (M = 51.56) 差 异 显著 ,在 记 
忆 困 难 词 对 时 , 奖赏 组 CM = 21.62) 和 非 奖赏 组 (WM = 
18.67) 差 异 不 显著 , 说 明 在 记 简 单词 对 时 ， 有 奖赏 
预期 的 奖赏 组 相 比 无 奖赏 预期 的 非 奖 赏 组 对 词 对 
进行 了 更 好 的 编码 , 成 绩 提 高 ; 而 在 记 困难 词 对 时 ， 
由 于 学 习 时 间 不 足 ， 奖 赏 预期 并 没 促进 困难 词 对 的 
学 习 ( 图 2b). 
2.25 ”奖赏 结果 与 难度 对 JOLs 的 影响 

为 考察 后 置 条 件 下 ， 奖 赏 组 内 奖赏 结果 和 难度 
对 限时 学 习 JOLs 的 影响 ,对 数据 进行 重复 测量 方 
差分 析 。 本 研究 为 获得 连续 数据 以 及 提高 被 试 对 高 
低 价 值 的 对 比 感 , 设置 价值 为 0~6, 数据 分 析 时 取 
高 价值 段 (5、6) 作 为 高 价值 ， 低 价值 段 (1、2) 作 为 低 
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价值 , 0 价值 与 无 奖赏 作为 对 比 (Castel et al., 2007; 
Soderstrom & McCabe，2011), 后 续 关 于 价值 的 分 
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表明 奖赏 组 产生 的 奖赏 预期 促进 了 被 试 简单 词 对 
记忆 , 验证 了 本 人 研究 奖赏 预期 能 促进 编码 的 假设 。 


析 皆 按 此 处 理 方式 。 结 果 发 现 : 奖赏 结果 主 效应 显 
著 , F(2, 46) = 9.25, p < 0.001, ni = 0.29, 高 价值 
JOLs (M = 52.53)， 低 价值 JOLs (M = 43.67) 和 0 价 
值 JOLs (36.65) 均 有 显著 差异 , 说 明 不 同 的 奖赏 结 
果 会 影响 个 体 的 学 习 判 断 ; 难度 主 效应 显著 ,Fl(1， 
23) = 34.86, p < 0.001, n = 0.60， 简 单词 对 JOLs 
(M= 54.87) 显 著 高 于 困难 词 对 (M = 44.97), 在 自 定 
步调 学 习 时 , 个 体 依然 会 依据 难度 进行 JOLs。 交互 
作用 不 显著 , F(2, 46) = 2.721, p = 0.076 (图 3a)。 
2.2.6 ”奖赏 结果 与 难度 对 回忆 正确 率 的 影响 

为 考察 后 置 条 件 下 ,奖赏 结果 和 难度 对 限时 学 
习 回 忆 正 确 率 的 影响 , 对 数据 进行 重复 测量 方差 分 
析 。 结 果 发 现 : 奖赏 结果 主 效应 显著 , F(2, 46) = 5.18, 
p = 0.009, n= 0.19, 高 价值 词 对 回忆 正确 率 (M = 
47.54) 显 著 高 于 低 价值 词 对 CM = 37.65) 和 0 分词 对 
(M = 37.61)， 低 价值 词 对 和 0 分 词 对 之 间 回 忆 正 确 
率 无 显著 差异 ; 表明 奖赏 结果 的 大 小 会 引起 被 试 回 
忆 正 确 率 的 差异 ， 具体 表 现 为 高 奖赏 结果 会 促进 个 
体 的 回忆 正确 率 。 难 度 主 效应 显著 , FA, 23) = 
102.71, p < 0.001, 2= 0.82, 简单 词 对 回忆 正确 率 
(M = 62.78) 显 著 高 于 困难 词 对 (M = 21.62), 这 与 假 
WAGE, 可 能 是 由 于 被 试 在 进行 JOLs 时 对 高 价值 
词 对 进行 了 复述 ; 交互 作用 不 显著 , F(2, 46) = 2.06, 
p= 0.139 (图 3b)。 
2.3 讨论 

实验 1 改进 先前 实验 范式 (Soderstrom & 
McCabe，2011)， 考 察 后 置 价 值 与 难度 对 限时 学 习 
的 影响 。 发 现 记忆 困难 词 对 时 ,奖赏 和 非 奖赏 组 回 
忆 成 绩 差异 不 显著 。 而 记忆 简单 词 对 时 差异 显著 ， 
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而 在 记忆 困难 词 对 时 ， 奖 赏 与 非 奖 赏 组 间 记 忆 成 绩 
和 JOLs 都 无 显著 差异 ， 可 能 是 因 词 对 过 难 ， 被 试 
无 法 在 有 限时 间 内 (4 s 内 ) 根 据 奖赏 预期 分 配 认 知 
资源 完成 有 效 学 习 。 先 前 研究 发 现 学 习 时 间 是 影响 
被 试 JOLs 和 学 习 成 绩 的 因素 。 因 此 , 实验 2 中 的 
编码 阶段 改 用 不 限时 的 自 定 步调 学 习 ， 进 一 步 探究 
奖赏 预期 和 难度 对 回忆 正确 率 以 及 元 记忆 监测 和 
控制 的 影响 。 

另外， 奖赏 结果 对 学 习 成 绩 有 显著 影响 , 高价 
值 比 低 价 值 和 0 价值 词 对 回忆 正确 率 更 高 。 可 能 基 
被 试 在 不 限时 JOLs 阶段 对 高 价值 词 对 进行 多 次 复 
述 提取 ， 而 对 0 价值 和 低 价值 项 目 较 少 复述 提取 。 
为 排除 JOLs 阶段 的 记忆 巩固 效应 , 实验 2 改 为 固 
定时 长 的 JOLs。 


3 实验 2: 编码 后 奖 芝 与 项 目 难度 
对 目 定 步调 学 习 的 影响 


将 学 习 时 间 限 制 取消 ， 进 行 自 定 步 调 学 习 ， 探 
究 奖 党 预期、 奖赏 结 果 和 难度 对 学 习 时 间 分 配 、 
JOLs 以 及 回忆 正确 率 的 影响 ; 并 将 JOLs 改 为 固定 
时 长 , 防止 JOLs 阶段 进行 记忆 巩固 。 根 据 实验 1 
结果 , 实验 2 采用 自 定 步调 学 习 时 间 和 固定 时 长 
JOLs， 由 于 价值 呈现 在 编码 后 , 假设 奖赏 结果 只 能 
影响 被 试 的 学 习 判 断 ， 对 回忆 正确 率 无 显著 影响 ， 
而 奖赏 预期 影响 学 习 时 间 分 配 ， 从 而 影响 记忆 成 绩 。 
3.1 实验 方法 
3.1.1 it 

东北 师范 大 学 60 人 参与 本 实验 , 根据 被 试 报 
名 顺序 随机 分 配 为 奖赏 组 (30 人 ) 和 非 奖 赏 组 (30 A), 
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图 3 不 同 价值 和 难度 的 JOLs 和 回忆 正确 率 
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6 名 被 试 因 记 忆 正 确 率 低 于 10% 剔 除 , 2 名 被 试 因 参 
与 类 似 实验 经 历 导 致 练习 效应 被 剔除 故 有 效 被 试 
52 名 (男生 25 A, 女生 27 A, 平均 年 龄 20.35 岁 ， 
SD = 2.34)。 被 试 要 求 同 实验 1。 
3.1.2 ”实验 材料 

同 实 验 1。 
3.1.3 ”实验 仪器 

同 实 验 1。 
3.1.4 ”实验 程序 

与 实验 1 基本 一 致 , 改 2 处 :(1) 取 消 学 习 时 限 ， 
被 试 认为 记 住 后 , 按 “ 空 格 ” 键 进入 下 一 屏 学 习 。(2) 
学 习 判 断 时 间 控 制 在 2 s (ULI 4)。 
3.2 ”结果 分 析 

实验 2 中 各 价值 项 目 及 控制 组 的 学 习 时 间 见 表 
2， 回 忆 正 确 率 和 JOLs 值 见 表 3。 
3.2.1 无 奖赏 和 0 价值 对 回忆 正确 率 影 响 

基于 无 奖赏 和 0 价值 两 个 条 件 ， 考 察 奖 赏 预期 


表 2 有 奖赏 组 与 无 奖赏 组 学 


RRA 等 : 编码 后 奖赏 影响 基于 议程 的 学 习 : 奖赏 预期 和 结果 的 作用 


547 


和 难度 对 自 定 步调 学 习 回 忆 正 确 率 的 影响 ,进行 混 
合 测量 方差 分 析 。 结果 发 现 : 组 别 主 效应 显著 , FA, 
50) =4.29, p = 0.044, n? = 0.08, 0 价值 词 对 回忆 正确 
Z(M = 52.95) 显 著 高 于 (M = 41.45) 无 奖赏 词 对 ; K 
明 奖 赏 结果 后 置 时 ， 奖赏 预 期 对 被 试 回忆 正确 率 产 
生 影响 。 难 度 主 效 应 显著 , FA, 50) = 142.74, p < 
0.001, ni = 0.74， 简 单词 对 回忆 正确 率 CM = 64.04) 
显著 高 于 困难 词 对 (M = 29.48); 交互 作用 不 显著 ， 
F(1, 50) = 1.40, p = 0.243. 
3.2.2 ”无 奖赏 和 0 价值 对 JOLs 影响 

基于 无 奖赏 和 0 价值 两 个 条 件 ， 考察 奖赏 预期 
和 难度 对 自 定 步 调 学 习 JOLs 的 影响 ,对 数据 进行 
混合 测量 方差 分 析 。 结果 发 现 : 组 别 主 效 应 不 显著 ， 
F(1, 50) = 0.56, p = 0.46, 无 奖赏 JOLs (M = 44.04) 
与 0 价值 词 对 (M = 48.20) 无 显著 差异 。 难 度 主 效应 
显著 , F(1, 50) =38.15, p < 0.001, n5== 0.43, 简单 词 
对 JOLs (M = 51.41) 显 车 高 于 困难 词 对 (WM =40.51); 
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2 奖赏 组 学 习 阶 段 流 程 图 


习 时 间 的 平均 数 及 标准 差 (M + SD) 


难度 无 奖赏 组 有 奖赏 组 (2 = 24) 
(n = 28) 0 1 2 3 4 5 6 
困难 9.65+7.50 13.12+7.38 14.054+9.63 14.48+10.18 13.53+9.20 13.80+47.62 14.95+9.41 14.39 = 9.41 
容易 8.58+7.40 12.344+7.53 10.09+6.12 12.324+7.75 12.04+7.13 11.62+7.14 10.97+6.73 12.19 7.93 
表 3 有 奖赏 组 与 无 奖赏 组 的 回忆 正确 率 和 学 习 判 断 值 的 平均 数 及 标准 差 (M + SD) 
n 无 奖赏 组 有 奖赏 组 (n = 24) 
(n = 28) 0 1 2 3 4 5 6 
回忆 正确 率 
困难 ” 22.61 土 17.58 35.96 +25.70 33.72+28.18 34.76+ 27.29 36.57 +33.32 36.48 +27.15 36.63 +27.46 34.71 + 31.87 
容易  60.30+20.48 66.89 + 30.68 71.99 +32.34 61.99 + 30.12 64.28+29.98 84.04422.35 65.96+22.72 62.55+36.61 
JOLs 
困难 ” 337.52 + 16.39 44.004 24.82 48.36+23.13 49.424 20.74 54.65+ 20.78 54.17 +22.32 50.904 22.76 55.47 + 22.79 
容易 50.564 17.59 52.40 +24.82 52.40+ 24.82 51.92 + 20.39 55.984 22.75 57.13 +19.73 59.24418.74 64.44 + 18.55 


548 心 理 


交互 作用 不 显著 , FA, 50) = 1.79, p = 0.187. 
3.2.3 ”奖赏 预期 与 难度 对 学 习 时 间 分 配 的 影响 

为 考察 后 置 条 件 下 ， 奖 赏 预期 和 难度 对 学 习 时 
间 分 配 的 影响 ， 对 数据 进行 混合 设计 方差 分 析 ， 结 
果 发 现 : 奖赏 预期 主 效应 显著 , FC, 51) = 4.76, p = 
0.034, ni = 0.09， 奖 赏 组 被 试 学 习 时 间 (M = 13.05) 
显著 高 于 非 奖 赏 组 被 试 CM = 8.73)， 表 明 奖 赏 预期 
的 有 无 影响 学 习 时 间 分 配 : 有 奖赏 预期 的 奖赏 组 相 
比 于 非 奖赏 组 会 分 配 更 多 的 学 习 时 间 以 获得 更 高 
分 数 ; 难度 主 效应 显著 , F(1, 51) = 32.28, p < 0.001, 
np = 0.39， 困 难 词 对 学 习 时 间 (M = 11.60) 显 著 高 于 
简单 词 对 CM = 9.78), 结果 表明 : 相 比 于 简单 词 对 ， 
被 试 会 分 配 更 多 学 习 时 间 给 困难 词 对 。 交互 作用 显 
著 , F(1, 51) = 5.10, p = 0.028, n= 0.09。 简单 效应 分 
析 发 现 : 仅 在 奖赏 组 内 ， 困 难 词 对 学 习 时 间 (M = 
14.37) 显 著 高 于 简单 词 对 (M = 11.74); 而 非 奖 赏 组 
内 ,简单 词 对 (M = 8.58) 和 困难 词 对 学 习 时 间 (M = 
9.65) 无 显著 差异 (图 5a)。 结果 表 明 : 仅 在 有 奖赏 预 
期 的 奖赏 组 内 ， 被 试 表现 为 对 不 同 难度 词 对 分 配 不 
同学 习 时 间 ; 而 在 无 奖赏 预期 的 非 奖 赏 组 内 ， 被 试 
并 未 表现 出 差异 。 

为 比较 无 奖赏 和 0 价值 对 学 习 时 间 分 配 的 影响 ， 
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困难 词 对 。 交 互 作用 不 显著 , F(1, 51) = 0.14, p = 
0.707。 
3.2.4 ”奖赏 结果 与 难度 对 学 习 时 间 分 配 的 影响 

为 考察 价值 后 置 条 件 下， 奖赏 结果 和 难度 对 学 
习 时 间 分 配 的 影响 ,进行 重复 测量 方差 分 析 ， 结 
发 现 : 奖赏 结果 主 效应 不 显著 , F(2, 46) = 0.53, p = 
0.592,， 价值 后 置 时 ,奖赏 结果 大 小 并 没有 影响 学 
习 时 间 分 配 ,， 这 与 假设 是 一 致 的 ; 难度 主 效 应 显著 ， 
F(1, 23) = 14.68, p < 0.001, mi = 0.39， 困 难 词 对 学 
习 时 间 (M = 14.37) 显 车 高 于 简单 词 对 (WM = 11.74), 
被 试 进行 学 习 时 间 分 配 时 以 难度 为 依据 ; 交互 作用 
不 显著 , F(2, 46) = 1.85, p = 0.169 (图 5b). 
3.25 ”奖赏 预期 与 难度 对 JOLs 的 影响 

为 考察 价值 后 置 条 件 下 ， 奖 赏 预期 和 难度 对 自 
定 步 调 学 习 JOLs 的 影响 ， 进 行 重复 测量 方差 分 析 ， 
结果 发 现 : 奖赏 预期 主 效应 显著 ，F(1，50) = 4.90, 
p= 0.031, np = 0.09， 有 奖赏 预期 组 JOLs (M = 
54.60) 显 著 高 于 无 奖赏 预期 组 OM = 44.04), 结果 表 
明 奖 赏 预期 促进 了 个 体 的 学 习 判 断 ; 难度 主 效应 显 
著 , F(1, 50) = 83.20, p < 0.001, n5= 0.63， 简 单词 对 
JOLs (M = 5$4.09) 显 著 高 于 困难 词 对 (M = 43.73), A 
定 步调 学 习 时 难度 依然 是 被 试 进行 JOLs 的 主要 线 


进行 混合 设计 方差 分 析 ， BRAM: 组 别 主 效应 显 
著 , F(1, 51) = 4.15, p = 0.047, n= 0.08, 0 价值 组 被 
试 学 习 时 间 (M = 12.73) 显 车 高 于 非 奖 赏 组 被 试 (M = 
8.73)， 表 明 奖 赏 预期 的 有 无 影响 学 习 时 间 分 配 : 有 
奖赏 预期 的 奖赏 组 相 比 于 非 奖 赏 组 会 分 配 更 多 的 
学 习 时 间 以 获得 更 高 分 数 ; 难度 主 效应 显著 ,Fl(1， 
51) = 4.09, p = 0.049, n$ = 0.07， 困 难 词 对 学 习 时 间 
(M = 11.03) 显 著 高 于 简单 词 对 (WM = 10.06), 结果 表 
明 : 相 比 于 简单 词 对 , 被 试 会 分 配 更 多 学 习 时 间 给 
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索 。 交 互 作用 显著 , F(1, 50) = 6.82, p = 0.012, n= 
0.12。 简 单 效 应 分 析 发 现 : 在 记忆 困难 词 对 时 ， 有 
奖赏 预期 组 的 JOLs (M = 50.98) 显 著 高 于 无 奖赏 预 
期 组 (M = 37.52); 而 在 记忆 简单 词 对 时 ， 有 奖赏 预 
期 组 的 JOLs (M = 58.21) 和 无 奖赏 预期 组 (M = 50.56) 
并 无 显著 差异 。 说 明 奖 赏 预期 对 元 记忆 监测 的 作用 
在 很 大 程度 上 受到 难度 的 影响 , 具体 表现 为 : 奖赏 
预期 会 促进 困难 词 对 的 学 习 判 断 而 对 简单 词 对 的 
学 习 判 断 无 影响 (图 6a)。 
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图 5 不 同 组 别 、 不 同 价值 和 难度 的 学 习 时 间 
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3.2.6 ”奖赏 预期 与 难度 对 回忆 正确 率 的 影响 

为 考察 价值 后 置 条 件 下 ， 奖赏 预 期 和 难度 对 自 
定 步调 学 习 回 忆 正 确 率 的 影响 ,进行 混合 设计 方差 
A, 结果 发 现 ， 奖赏 预期 主 效应 显著 , F, 50) = 
6.51, p = 0.014, $= 0.12, 奖赏 组 被 试 回忆 正确 率 
(M = 54.03) 显 著 高 于 非 奖 赏 组 被 试 (M = 41.45), 与 
实验 2 假设 一 致 , 在 自 定 步 调 学 习 时 ， 即 让 被 试 充 
分 编码 后 ， 奖 赏 预期 会 引起 被 试 记忆 成 绩 的 提高 ; 
难度 主 效应 显著 , F(1, 50) = 418.97, p < 0.001, n} = 
0.89, 简单 词 对 回忆 正确 率 (M = 65.12) 显 车 高 于 困 
难 词 对 QM = 29.40)， 有 充足 学 习 时 间 时 ， 难 度 依然 
是 影响 记忆 成 绩 的 重要 因素 。 交 互 作 用 不 显著 FA, 
50) = 1.50, p = 0.227 (图 6b)。 
3.2.7 ”奖赏 结果 与 难度 对 JOLs 的 影响 

为 考察 价值 后 置 条 件 下 ， 奖赏 结 果 和 难度 对 自 
定 步调 学 习 时 JOLs 的 影响 ,进行 重复 测量 方差 分 
析 ， 结 果 发 现 : 奖赏 结果 主 效 应 显著 , F2, 46) = 
5.18, p = 0.009, np = 0.18， 高 低 价值 词 对 之 间 JOLs 
(Ma = 59.25, MA = 51.42) 无 显著 差异 ,但 高 价值 词 
对 JOLs 显著 高 于 0 分 词 对 (M = 48.20)， 表 明 奖 赏 结 
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图 6 不 同 组 别 和 难度 的 JOLs 和 回忆 正确 率 


奖赏 组 


果 会 影响 个 体 的 学 习 判 新， 具体 表现 为 高 奖赏 结果 
相 比 于 0 奖赏 结果 的 学 习 判 断 更 高 ,个 体 更 有 信心 
记 住 具有 高 奖赏 结果 的 词 对 ; 难度 主 效应 显著 , F(1， 
23) =20.38, p < 0.001, nj = 0.47， 简 单词 对 JOLs 
(M= 58.21) 显 著 高 于 困难 词 对 (M = 50.98); 交互 作 
用 不 显著 , F(2, 46) = 1.99, p = 0.149 (图 7a)。 
3.2.8 ”奖赏 结果 与 难度 对 回忆 正确 率 的 影响 

为 考察 后 置 条 件 下 ， 奖 赏 结果 和 难度 对 自 定 步 
调 学 习 回 忆 正 确 率 的 影响 ,进行 重复 测量 方差 分 析 ， 
结果 发 现 : 奖赏 结果 主 效应 不 显著 , F2, 46) = 0.01, 
p = 0.986, 说 明 价 值 所 带 来 的 奖赏 结果 不 会 影响 个 
体 的 回忆 正确 率 ; 难度 主 效应 显著 ，F(1，23) = 
115.42, p < 0.001, m2 = 0.84， 简 单词 对 回忆 正确 率 
(M = 65.12) 显 著 高 于 困难 词 对 (WM = 29.40), 在 自 定 
步调 学 习 时 , 被 试 有 充足 时 间 编 码 ， 对 困难 词 对 的 
记忆 成 绩 仍 较 低 ; 交互 作用 不 显著 , F(2, 46) = 0.17, 
p=0.842 (图 7b)。 
3.3 ”讨论 

与 实验 1 结果 类 似 , 词 对 难度 对 回忆 成 绩 、 学 
习 判 新 和 学 习 时 间 分 配 均 有 影响 ,困难 词 对 被 分 配 
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图 7 不 同 价值 和 难度 的 JOLs 和 回忆 正确 率 
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更 多 学 习 时 间 ， 而 简单 词 对 回忆 成 绩 和 JOLs 却 高 
于 困难 项 目 。 再 次 证 明 ， 难 度 是 个 体 进 行 学 习 判 断 
的 重要 内 部 线索 , 也 是 影响 学 习 时 间 分 配 的 重要 
因素 。 

价值 呈现 于 词 对 充分 编码 后 ,被 试 在 编码 阶段 

法 得 知 价值 (奖赏 结果 ) 的 高 低 ， 因 此 奖赏 结果 仅 
4 JOLs 产生 影响 ， 而 无 法 对 学 习 时 间 产 生 影 啊 
表现 为 高 价值 词 对 的 JOLs 显著 高 于 低 价值 词 对 ， 
而 高 低 价值 词 对 的 学 习 时 间 没 有 差异 。 并 且 , JOLs 
阶段 时 间 固 定 , 被 试 无 法 根据 奖赏 结果 在 此 阶段 进 
行 复述 巩固 ， 因 此 ， 高低 价 值 词 对 回忆 正确 率 无 显 
著 差 异 。 验 证 实验 2 的 假设 : 实验 1 中 奖赏 结果 对 
记忆 成 绩 的 影响 是 因 被 试 在 JOLs 阶段 进行 了 记忆 
巩固 ,实验 2 将 JOLs 改 为 定时 , 被 试 无 法 在 此 阶段 
对 高 价值 项 目 进行 充分 复述 ， 奖赏 结 果 仅 影响 被 试 
的 元 记忆 监测 , 不 影响 记忆 成 绩 , 与 先前 研究 结 
一 致 (Dunlosky & Connor, 1997: Mazzoni & 
Cornoldi, 1993; Soderstrom & McCabe, 2011). 

通过 奖赏 与 非 奖 赏 组 比较 ， 可 以 得 到 奖赏 预期 
对 JOLs、 学 习 时 间 以 及 回忆 成 绩 机 的 有 影响。 结果 发 
WM, 自 定 步 调 学 习 条 件 下 ,记忆 困难 词 对 时 ,奖赏 
组 被 试 JOLs 和 学 习 时 间 高 于 非 奖 赏 组 ; 而 记忆 简 
单词 对 时 ， 奖 赏 与 非 奖 赏 组 学 习 时 间 分 配 的 差异 相 
比 于 困难 词 对 时 变 小 , JOLs 差异 不 显著 。 表 明 在 元 
记忆 监测 过 程 中 ， 难 度 高 时 个 体会 根据 奖赏 预期 进 
行 学 习 判 断 和 学 习 时 间 分 配 ; 而 难度 降低 时 ， 奖 赏 
预期 不 再 成 为 学 习 判 断 和 学 习 时 间 分 配 的 重要 依 
据 。 即 随 着 难度 的 降低 ， 奖 赏 预期 对 学 习 时 间 分 配 
的 影响 在 变 小 。 但 是 ,这 并 未 体现 在 回忆 成 绩 上 
高 低 难 度 词 对 的 回忆 正确 率 都 表现 出 奖赏 预期 的 
促进 作用 。 综 上 ,奖赏 预期 对 元 记忆 监测 和 控制 的 
作用 会 受到 难度 的 影响 ， 而 这 种 影响 并 未 体现 在 回 
忆 成 绩 上 。 

在 自 定 步调 学 习 时 ， 有 奖赏 预期 但 无 奖赏 结 
的 0 价值 回忆 正确 率 显 著 高 于 无 奖赏 组 , 表明 在 学 
习 时 间 充 足 时 ， 奖 赏 预期 促进 被 试 的 记忆 成 绩 。 通 
过 比较 学 习 时 间 可 以 发 现 ， 有 奖赏 预期 组 被 试 在 编 
码 阶段 对 词 对 进行 充分 编码 以 获得 更 高 的 成 绩 ， 因 
此 与 实验 1 相 比 ， 被 试 对 0 价值 词 对 的 回忆 正确 率 
和 JOL 都 显著 提高 。 

奖赏 结果 对 JOLs 有 显著 影响 , 高 、 低 价值 都 
和 0 价值 有 显著 差异 ,但 高 、 低 价值 间 无 显著 差异 ， 
表明 奖赏 结果 对 元 记忆 监测 的 作用 可 能 会 受到 奖 
赏 结果 梯度 影响 , 梯度 足够 大 时 才 有 明显 作用 。 并 


学 AR 第 55 卷 
且 当 奖赏 预期 和 难度 同时 存在 时 ,二 者 哪个 会 成 为 
影响 学 习 的 主要 依据 需 进一步 探究 。 因 此 , 实验 3 
中 进一步 操控 奖赏 预期 , 考察 奖赏 预期 大 小 对 自 定 
步调 学 习 的 影响 。 
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一 步 操 控 奖 赏 预期 大 小 ,考察 其 对 自 定 步调 

JOLs 和 回忆 正确 率 的 影响 
如 果 奖 赏 预期 的 大 小 影响 回忆 正确 率 (Yu et 
2020), 那么 大 梯度 奖赏 预期 比 小 梯度 奖赏 预期 对 
学 习 不 同 难 度 词 对 时 的 学 习 时 间 分 配 有 更 大 促进 
作用 。 
4.1 实验 方法 
4.1.1 ”被 试 

依据 前 人 研究 中 的 平均 效应 量 d = 0.6 来 确定 
被 试 量 (Undorf & Bröder, 2020; Undorf et al., 2018)。 
通过 Gpower3 计算 得 出 , 1 — B = 0.95, a = 0.05 时 推 
荐 的 最 小 被 试 量 为 8 人 。 东 北 师 范 大 学 18 名 在 校 
大 学 生 参 加 本 实验 , 因 记 忆 成 绩 过 低 筛 除 3 名 被 试 ， 
故 有 效 被 试 15 名 (男生 4 人 , 女生 11 A, 平均 年 龄 
22.00 岁 , SD = 2.17 岁 )。 被 试 要 求 同 实验 1。 
4.1.2 ”实验 材料 

因 实 验 3 价值 数目 由 7 变 为 6, 故 从 实验 1 中 
选取 48 个 词 对 作为 实验 3 的 材料 ， 每 个 价值 包括 8 
个 词 对 ， 困 难 与 简单 词 对 各 24 个 。 
4.1.3 ”实验 仪器 

同 实验 1。 
4.1.4 ”实验 程序 

与 实验 2 基本 一 致 , 但 实验 3 取消 控制 组 改 为 
被 试 内 设计 ( 见 图 8)。 被 试 学 习 两 个 block, 一 个 
block 项 日 价值 为 1、3、6 ( 低 奖赏 预期 )， 另 一 个 
block 项 目 价值 为 1、6、12 (高 奖赏 预期 )。 每 一 个 
block 开始 前 ,告知 被 试 接 下 来 一 组 词 的 分 值 。 呈 现 
顺序 被 试 间 平 衡 。 
4.2 结果 

实验 3 中 各 价值 项 目的 学 习 时 间 见 表 4， 回 忆 
正确 率 和 JOLs 值 见 表 5。 
4.2.1 奖赏 预期 与 难度 对 学 习 时 间 分 配 的 影响 

为 考察 后 置 条 件 下 ， 奖 赏 预期 和 难度 对 学 习 时 
间 分 配 的 有 影响， 进 行 重复 测量 方差 分 析 ， 结 果 发 
现 : 奖赏 预期 主 效应 显著 , FA, 14) = 4.55, p = 0.050， 
Np = 0.25， 高 预期 词 对 学 习 时 间 (M = 12.06) 显 著 高 
于 低 预 期 词 对 (WM = 10.25)， 表 明 高 奖赏 预期 相 比 于 
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图 8 实验 3 学 习 阶 段 流 程 图 
表 4 各 价值 项 目的 学 习 时 间 的 平均 数 及 标准 差 (M + SD, n = 15) 
高 预期 低 预 期 
难度 
1 6 12 1 3 6 
困难 11.58+6.12 12.86 + 8.37 13.73 £9.75 10.00 + 4.32 10.48 + 4.77 10.08 + 4.92 
容易 10.44 + 6.13 11.31 46.77 12.44 + 9.10 9.70 + 5.87 8.14 +3.44 9.28 + 3.14 
表 5 各 价值 项 目的 回忆 正确 率 和 学 习 判 断 值 的 平均 数 及 标准 差 (M + SD, n = 15) 
高 预期 低 预 期 
难度 
1 6 12 1 3 6 
忆 正 确 率 
困难 41.67 + 24.40 45.00 + 21.55 41.67 + 20.41 36.67 + 31.15 33.33 + 26.16 31.67 + 29.07 
容易 78.33 + 26.50 73.33 + 25.82 80.00 + 21.55 61.67 + 24.76 53.33 + 32.55 56.67 + 27.50 
JOLs 
困难 41.18 + 23.10 49.03 + 23.77 55.92 + 26.02 25.39 + 23.75 45.03 + 24.44 54.59 + 25.06 
容易 46.41 + 26.42 56.54 + 21.71 64.89 + 23.63 44.35 + 22.94 47.33 + 20.95 59.41 + 22.88 


低 奖赏 预期 对 学 习 时 间 分 配 有 促进 作用 ; 难度 主 效 
应 不 显著 , FA, 14) = 3.87, p = 0.069, 在 奖赏 预期 足 


4.2.2 oo 
为 考察 后 置 条 件 下 ,奖赏 预期 和 难度 对 自 定 步 


够 大 时 ， 奖赏 预期 对 学 习 时 间 分 配 的 作用 超过 了 词 
对 难度 的 作用 ; 交互 作用 不 显著 , FO, 14) = 1.80, 
p = 0.202 (图 9)。 
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国 简 单 重 困 难 
不 同 奖 赏 预期 和 难度 对 学 习 时 间 分 配 的 影响 


调 学 ee 进行 重复 测量 方差 分 析 ， 结 
REM: 奖赏 预期 主 效应 显著 , F, 14) = 7.85, p = 
0.014, n= 0.36， 高 预期 词 对 的 JOLs (M = 52.30) 显 
著 高 于 低 预 期 词 对 (M = 47.53)， 表 明 奖 赏 预期 高 低 
影响 个 体 学 习 判 断 ， 主 要 表现 为 高 奖赏 预期 的 
JOLs 更 高 ; 难度 主 效应 显著 , FO, 14) = 10.96, p = 
0.005, mi= 0.44， 简 单词 对 的 JOLs (M = 53.18) fb 
高 于 困难 词 对 (CM = 46.69); 交互 作用 不 显著 ,Fl(1， 
14) = 0.26, p = 0.617 (图 10a). 


4.2.3 EE a E ere 响 
为 考察 后 置 条 件 下 ,奖赏 预 期 和 难度 对 自 定 步 


es Seta 进行 重复 测量 方差 分 析 ， 

结果 发 现 : 奖赏 预期 主 效应 i SF, F(1, 14) = 26.36, 
p< 0.001, nj = 0.65， 高 预期 词 对 回忆 正确 率 (M = 
60.00) 显 著 高 于 低 预 期 词 对 (CM = 45.56), 结果 表明 
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图 10 不 同 奖 赏 预期 和 难度 的 JOLs 和 回忆 正确 率 


高 奖赏 预期 可 以 提高 个 体 的 回忆 正确 率 ; 难度 主 效 
应 显著 , FC, 14) = 60.46, p < 0.001, ni = 0.81, 简单 
词 对 回忆 正确 率 (M= 67.22) 显 著 高 于 困难 词 对 (WM = 
38.33); 交互 作用 不 显著 , FA, 14) = 2.31, p = 0.150 
(图 10b)。 

因 本 实验 的 奖赏 条 件 设 定 可 能 使 奖赏 结果 和 
奖赏 预期 的 作用 又 加 ， 因 此 进一步 选取 高 低 奖赏 预 
期 组 中 价值 为 1 的 词 对 , 控制 奖赏 结果 相同 , 但 此 
时 高 预期 组 中 价值 为 1 词 对 奖赏 预期 比 低 奖 赏 预期 
组 更 大 ， 就 可 以 分 离 出 奖赏 预期 的 作用 。 对 高 低 奖 
赏 预期 组 在 价值 1 时 的 回忆 成 绩 进 行 重复 测量 设计 
方差 分 析 : 奖赏 预期 主 效应 显著 , FU, 14) = 6.06, 
p= 0.026, n5 = 0.29， 高 预期 词 对 价值 1 回忆 正确 率 
(M = 60.00) 显 车 高 于 低 预期 词 对 价值 1 (M= 49.17), 
结果 表明 高 奖赏 预期 可 以 提高 个 体 的 回忆 正确 率 ; 
难度 主 效 应 显著 , F(1, 14) = 34.99, p < 0.001, n} = 
0.70, 简 单词 对 回忆 正确 率 (M = 70.00) 显 著 高 于 困 
难 词 对 (M = 39.17); 交互 作用 不 显著 , FU, 15) = 
0.71, p = 0.413 (图 11) 
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图 11 不 同 奖赏 预期 价值 1 和 难度 的 回忆 正确 率 


低 预期 


4.3 讨论 

结果 表明 ， 难 度 作为 个 体 元 记忆 监测 的 重要 内 
部 线索 ,依然 对 个 体 学 习 判 断 产生 影响 ,简单 词 对 
JOLs 高 于 困难 词 对 ; 同时 难度 对 回忆 成 绩 的 影响 
也 是 稳定 存在 的 ,简单 词 对 回忆 成 绩 高 于 困难 词 
对 。 然 而 在 学 习 时 间 分 配 上 , 难度 的 主 效应 消失 ， 
这 与 实验 2 结果 并 不 一 致 。 可 能 是 由 于 在 实验 3 中 ， 
价值 梯度 增 大 ,被 试 可 以 更 清楚 地 觉察 到 奖赏 预期 
的 重要 性 ， 从 而 使 奖赏 预期 取代 难度 成 为 影响 学 习 
时 间 分 配 的 主要 依据 (Ariel et al., 2009; Yu et al., 
2020). 

奖赏 预期 对 JOLs、 学 习 时 间 分 配 及 回忆 成 绩 
均 产 生 影响 。 表 现 为 高 预期 项 目 JOLs、 学 习 时 间 
和 回忆 成 绩 均 高 于 低 预 期 项 目 。 结合 实验 1 和 实验 
2 的 结果 ,在 后 置 条 件 下 ， 奖 赏 结 果 和 奖赏 预期 对 
个 体 记 忆 和 元 记忆 的 影响 存在 分 离 。 具 体 来 说 ,， 奖 
赏 结果 仅 促 进 了 个 体 在 编码 完成 后 的 记忆 巩固 ， 而 
奖赏 预期 的 有 无 和 奖赏 预期 的 高 低 对 个 体 编码 和 
元 记忆 监控 均 产 生 影响 。 


5 总 讨论 


本 研究 考察 了 奖赏 结果 、 奖 赏 预期 和 项 目 难 度 
对 学 习 时 间 分 配 、JOLs 和 回忆 正确 率 的 影响 , 把 奖 
党 预期 的 作用 补充 进 ABR 模型 。 
51 奖赏 结果 、 奖 赏 预 期 和 项 目 难 度 对 元 记忆 上 监 

测 和 控制 的 影响 

本 研究 结果 表明 ,奖赏 结果 、 奖 赏 预期 和 项 目 
难度 会 对 个 体 元 记忆 监测 产生 影响 。 实 验 1 通过 改 
进 Soderstrom 和 McCabe (2011) 的 实验 程序 ， 发现 
个 体会 依据 奖赏 结果 、 奖 赏 预期 和 难度 线索 进行 学 
习 时 间 分 配 和 JOLs。 在 记忆 表现 上 , 奖赏 预期 和 难 
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度 的 交互 作用 显著 ,限时 学 习 时 奖赏 预期 可 以 促进 
个 体 对 简单 词 对 的 记忆 成 绩 。 而 个 体 的 JOLs 呈现 
出 价值 导向 ， 高 价值 项 目 JOLs 高 于 低 价值 项 目 ， 
这 表明 了 奖赏 结果 能 够 促进 个 体 的 元 记忆 监测 过 程 。 

由 于 本 人 研究 奖赏 结果 呈现 于 控制 过 程 后 ， 故 而 
奖赏 结果 无 法 影响 个 体 元 记忆 控制 过 程 。 实验 2 与 
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期 * 和 “奖赏 结果 ”的 界定 并 不 明晰 。 

本 人 研究 区 分 了 奖赏 预期 和 奖赏 结果 对 自主 学 
习 的 影响 ,补充 和 完善 了 基于 议程 的 自主 学 习 模 
型 。 首 先 , 在 价值 后 置 的 条 件 下 ， 自 主 学 习 会 受到 
奖 贫 预期 的 影响 ,并 且 通 过 操纵 价值 梯度 增 大 使 得 
奖 沉 预期 变 大 ,奖赏 预期 可 以 取代 难度 成 为 元 记忆 


实验 3 中 由 于 限制 了 JOLs 的 时 间 ， 奖赏 结 果 对 记 
忆 成 绩 的 影响 消失 , 但 仍 对 JOLs 产生 影响 。 实 验 2 
和 实验 3 中 关于 奖赏 预期 和 项 目 难 度 对 学 习 时 间 分 
配 的 相关 结果 表明 ， 奖赏 预期 和 项 目 难度 都 会 对 元 
记忆 控制 产生 影响 ,通过 自 定 步调 学 习 时 间 ， 被 试 
有 足够 的 时 间 进 行 编码 ， 奖赏 预 期 的 作用 突显 出 
来 。 并 且 通 过 纵向 分 析 实 验 2 和 3 的 结果 可 以 看 出 ， 
随 价值 梯度 加 大 ,奖赏 预期 能 取代 难度 成 为 元 记忆 
控制 的 主导 线索 。 

为 突出 奖赏 结果 和 奖赏 预期 各 上 自 对 元 记忆 监 
测 和 控制 的 有 影响， 本 研究 分 别 以 奖赏 结果 和 奖赏 预 
期 两 种 视角 对 奖赏 组 和 无 奖赏 组 进行 了 比较 ,但 是 ， 
这 种 比较 方式 却 忽 视 了 奖赏 组 和 无 奖赏 组 之 间 奖 
赏 结果 和 奖赏 预期 共同 影响 带 来 的 差异 。 因 此 本 文 
将 有 奖赏 预期 但 无 奖赏 结果 的 0 价值 , 与 无 奖赏 预 
期 旦 无 奖赏 结果 的 无 奖赏 组 进行 比较 , 结果 发 现 二 
者 仅 在 元 记忆 层面 有 显著 差异 。 这 一 结果 可 能 是 由 
于 奖赏 预期 的 促进 作用 与 无 结果 的 抑制 作用 相抵 
TA, 使 被 试 的 回忆 正确 率 与 无 奖赏 相同 。 为 进一步 
分 析 奖 赏 预期 的 作用 , 在 实验 3 中 将 高 奖赏 预期 组 
价值 1 与 低 奖赏 预期 组 价值 1 进行 比较 ,二 者 均 作 
为 价值 的 起 始点 且 奖 赏 结果 相同 。 结果 表明 在 奖赏 
结果 相同 的 情况 下 ,高 奖赏 预期 组 回忆 正确 率 高 于 
低 奖 赏 预期 组 ,表明 了 奖赏 预期 的 作用 。 未 来 研究 
可 以 改进 实验 范式 以 及 数据 分 析 方 法 ,在 控制 奖赏 
结果 和 奖赏 预期 共同 影响 的 基础 上 ， 独 立地 分 析 奖 
赏 结果 和 奖赏 预期 对 个 体 元 记忆 监测 和 控制 的 影响 。 
5.2 ”对 基于 议程 模型 的 支持 和 补充 

先前 研究 表明 ,基于 议程 模型 中 价值 对 学 习 时 
间 的 影响 具有 时 间 依 赖 性 (Soderstrom & McCabe, 
2011), 具体 来 说 ， 当 价值 呈现 在 项 目前 或 与 项 目 
同时 呈现 时 , 价值 会 对 自 定 步 调 学 习 产 生 影 响 。 然 
而 价值 呈现 方式 不 同 会 产生 不 同 的 奖赏 结构 成 分 ， 
先 于 或 同时 与 项 目 呈 现 的 价值 ， 其 本 质 为 奖赏 结 
价值 在 项 目 后 呈现 ， 此 时 会 引发 奖赏 预期 。 将 两 者 
统称 为 “价值 ”并 不 能 清晰 说 明 奖 赏 结构 中 不 同 成 
分 对 自主 学 习 的 影响 (Mason et al., 2017)。 因 此 ， 先 
前 研究 中 对 价值 呈现 时 间 不 同 所 形成 的 “奖赏 预 


监控 的 决定 性 线索 , 在 文 持 议 程 模 型 原 有 假设 的 基 
础 上 进一步 扩展 了 奖赏 预期 对 自我 调节 学 习 的 影 
啊 。 其 次 ,奖赏 预期 与 奖赏 结果 对 自主 学 习 的 影 啊 
机 制 不 同 。 有 具体 来 说 ， 当 价值 呈现 在 编码 前 时 ,个 
体 不 存在 奖赏 预期 ， 此 时 个 体 根 据 已 知 的 奖赏 结 
建立 议程 , 并 以 此 为 基础 开展 学 习 活 动 ; 当 价值 呈 
现在 编码 后 时 ， 主 要 是 奖赏 预期 对 自主 学 习 产 生 影 
响 , 个 体 根 据 奖 赏 预期 建立 议程 ,在 此 基础 上 对 自 
主 学 习 进 行 调整 。 
53 ”对 教育 教学 实践 的 启示 

个 体 如 何 高 效 利 用 有 限 的 认 知 资源 来 提高 记 
忆 成 绩 是 元 记忆 研究 要 解决 的 关键 问题 。 学 习 过 程 
中 记忆 材料 的 难度 并 不 相同 (Laursen & Fiacconi, 
2021), 为 提高 学 习 效 率 ,学习 者 需要 综合 考虑 材 
料 价值 、 难 度 和 可 用 学 习 时 间 等 因素 进行 合理 的 认 
知 资源 分 配 。 本 研究 通过 设置 后 置 奖赏 的 方式 考察 
了 奖赏 预期 和 奖赏 结果 对 个 体 记 忆 以 及 元 记忆 过 
程 的 有 影响， 其 研究 发 现 有 如 下 教育 启示 : 第 一 , 在 
教学 中 可 以 恰当 设置 奖赏 来 促进 个 体 自主 学 习 效 
果 。 如 ,学 习 前 预告 成 功 记忆 会 获取 一 定 的 奖赏 ， 
但 不 明确 具体 奖赏 数额 而 在 学 习 后 呈现 具体 数额 ， 
比 在 学 习 前 明确 告知 具体 数额 或 者 分 值 ， 对 学 习 者 
的 学 习 时 间 分 配 会 有 更 好 的 促进 作用 ; 第 二 ， 对 较 
难 材料 的 学 习 ， 在 学 习 前 给 予 奖 赏 预期 会 促进 学 习 
时 间 分 配 进而 促进 记忆 效果 提升 , 但 要 注意 给 学 生 
自主 分 配 学 习 时 间 和 调节 学 习 进 程 的 机 会 ， 而 不 是 
由 教师 来 控制 学 习 时 间 和 进程 。 因 为 如 果 学 习 时 间 
过 短 会 影响 个 体 对 于 奖赏 预期 的 权衡 , 减弱 奖赏 预 
期 对 学 习 时 间 分 配 和 学 习 效 果 的 提升 作用 ; 第 三 ， 
相 比 于 容易 项 目 ， 困 难 项 目 学 习 可 获得 的 奖赏 预期 
更 大 时 ,奖赏 预期 的 作用 在 学 习 时 间 分 配 中 取代 难 
度 成 为 主要 影响 因素 。 所 以 在 教学 中 ,可 以 通过 设 
置 不 同 的 奖赏 预期 梯度 来 引导 个 体 对 于 更 困难 材 
料 分 配 更 多 学 习 时 间 ， 从 而 提高 记忆 成 绩 。 


6 结论 


本 人 研究 通过 3 个 实验 考察 奖赏 预期 和 奖赏 结 
对 学 习 时 间 分 配 、 回 忆 正 确 率 和 JOLs 的 影响 ， 结 
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论 如 下 : 

(1) 个 体会 综合 奖赏 预期 、 奖 赏 结果 和 难度 构建 
学 习 议 程 , 足够 大 的 奖赏 预期 会 超越 难度 成 为 议程 
构建 的 主导 因素 。 

(2) 奖 赏 预期 和 奖赏 结果 对 记忆 成 绩 、 学 习 时 间 
分 配 和 学 习 判 断 的 影响 受 学 习 条 件 调节 。 
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The effect of after-encoding rewards on agenda-based learning: 
The role of reward expectation and reward outcome 


JIANG Yingjle, MA Xiaoxiao, JIANG Yuantao, REN Jimei, LONG Yiting 
(School of Psychology, Northeast Normal University, Changchun 130024, China) 


Abstract 


Metamemory monitoring is a process in which individuals subjectively evaluate or judge the memory 


process and state, and the common indicator is judgments of learning (JOLs). Metamemory control is the 


regulation and control of memory processes carried out on the basis of metamemory monitoring, and the study 


time allocation during self-paced learning is a central component of metamemory control. According to 


Agenda-Based Regulation Model (ABR), individuals in the learning process will comprehensively analyze 


various factors such as task objectives, task constraints to construct the learning agenda, which is used to 


prioritize the study items and the amount of time needed to study. However, the main concern of the previous 


studies is the value presented as a reward outcome (reward obtained after successfully memory), leading to a 


lack of valid examination of whether reward expectation (prediction of reward outcome) affects the agenda 


construction and memory performance. Therefore, the aim of this study was to supplement the reward 
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expectation into the ABR model by verifying whether a sufficiently high reward expectation can replace 
difficulty with exerting a dominant influence on JOLs and time allocation in an agenda construction. 

Experiment 1 added a control group on the basis of Soderstrom and McCabe's (2011) to examine the effect 
of reward expectation and difficulty on JOLs and memory rates under a time limited learning condition by 
presenting the reward posteriorly. Experiment 2, which abolished the limited time learning to self-paced learning, 
was designed to examine the effect of reward expectation and difficulty on the study time allocation. To go a 
step further, Experiment 3 controlled reward expectation in the test by manipulating the value gradient, and was 
designed to examine the effect of the size of the gradient of reward expectation. 

The current study found that: (1) under the limited time learning condition in Experiment 1, reward 
outcomes facilitated the memory performance and JOLs of both easy and hard word pairs, and reward 
expectation only improved the memory performance of easy word pairs without significant effects on JOLs. (2) 
in self-paced learning in Experiment 2, reward outcome only affected the JOLs rather than memory performance, 
but reward expectation promoted both JOLs and study time allocation thus improving the memory performance, 
what’s more, JOLs and study time allocation of hard word pairs in condition with reward expectation are higher 
than with no reward. (3) in self-paced learning in Experiment 3, the influence of difficulty on study time not 
significant any more, reward expectation beyond difficulty becomes the main factor affecting the study time 
allocation. 

The above results proved that reward expectation is a contributing factor in ABR model. Individuals 
synthesize reward expectation, reward outcome and difficulty while constructing a learning agenda, and reward 
expectation overrides difficulty as the dominant factor in agenda construction when it is sufficiently large. 
However, the effects of reward expectation and reward outcome on memory performance, study time allocation, 
and JOLs were modulated by the learning conditions. 

Keywords reward expectation, judgments of learning, study time allocation, metamemory, memory 


